基于分数的生成模型(SGM)需要近似中间分布的分数$ \ nabla \ log p_t $以及前进过程的最终分布$ p_t $。这些近似值的理论基础仍然缺乏。我们发现SGM能够从基础(低维)数据歧管$ \ MATHCAL {M} $中产生样本的精确条件。这确保我们能够生成“正确的样本”。例如,以$ \ mathcal {m} $作为面部图像的子集,我们发现SGM稳健产生面部图像的条件,即使这些图像的相对频率可能无法准确表示真实数据生成分布。此外,该分析是了解SGMS的概括属性的第一步:采用$ \ Mathcal {M} $作为所有培训样本的集合,我们的结果提供了SGM何时记住其培训数据的精确描述。
translated by 谷歌翻译